可以与其他代理人互动以完成给定任务的自主代理的发展是人工智能和机器学习研究的核心领域。为了实现这一目标,自主代理研究小组开发了用于自主系统控制的新型机器学习算法,特别关注深度强化学习和多代理强化学习。研究问题包括可扩展的协调代理政策和代理间沟通;从有限观察的情况下对其他代理的行为,目标和组成的推理;以及基于内在动机,课程学习,因果推断和代表性学习的样品学习。本文概述了该小组正在进行的研究组合,并讨论了未来方向的开放问题。
translated by 谷歌翻译
当用于自动驾驶时,目标识别可以更准确地预测其他车辆的未来行为。砂砾的最新目标识别方法已被证明是快速,准确,可解释和可验证的。在自动驾驶中,车辆可能会遇到训练期间看不见的新型场景,并且由于阻塞而部分可观察到环境。但是,砂砾只能在固定框架方案中运行,具有完整的可观察性。我们提出了一种新颖的目标识别方法,名为目标识别,并在封闭(OGRIT)下使用可解释的树,该方法解决了这些砂砾的这些缺点。我们证明,由于阻塞,Ogrit可以在不同的方案和处理丢失的数据之间进行概括,同时仍然快速,准确,可解释和可验证。
translated by 谷歌翻译